Exploración de los datos abiertos de COVID-19 México


Síguenos en nuestra página de Facebook "Análisis y visualización de datos"

https://www.facebook.com/An%C3%A1lisis-y-visualizaci%C3%B3n-de-datos-100602148375744/?ti=as

Introducción

La pandemia COVID-19 es uno de las peores situaciones que nos ha tocado vivir en México y en el mundo en los últimos años. Si bien, podemos obtener información acerca de la situación de esta pandemia en nuestro país en las conferencias emitidas diariamente, siempre quedan preguntas o nos surge algún interés en particular. Para esto, la Secretaría de Salud en su página de COVID publica los datos abiertos que utilizan para realizar algunos de los los análisis que muestran diario. El tener disponibles estos datos nos permite explorar más allá de lo que nos muestran, resolver nuestros propios intereses y tratar de estar mejor informados y cuestionarnos acerca de lo que los medios informan.

En esta ocasión, decidí trabajar en los los Datos Abiertos de COVID-19 para poder compartirlo con ustedes, presentando distintas visualizaciones que nos ayuden a entender como ha ido evolucionando la pandemia en el pais y mantenernos informados en algo que es de interés público. Al mismo tiempo, si tienen alguna duda, interés en explorar algo o comentarios acerca del análisis, me pueden dejar sus comentarios en nuestra página de Facebook "Análisis y visualización de datos". El análisis lo estoy actualizando periódicamente.

Cabe aclarar que en esta exploración de los datos de COVID19 no muestro modelos ni predicciones ya que no estoy especializado en cuestiones epidemiológicas.

En una vista rápida de los datos, con un formato más completo, podemos ver la siguente información:

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
0 2020-08-23 0535aa 2 IMSS 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-04-15 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TLALPAN
1 2020-08-23 0e5166 2 IMSS 2 HOMBRE BAJA CALIFORNIA BAJA CALIFORNIA AMBULATORIA 2020-04-04 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA TIJUANA
2 2020-08-23 110a76 2 IMSS 27 MUJER PUEBLA TABASCO AMBULATORIA 2020-04-03 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CENTRO
3 2020-08-23 096429 2 ESTATAL 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA AMBULATORIA 2020-04-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA MEXICALI
4 2020-08-23 151347 2 ESTATAL 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA AMBULATORIA 2020-05-13 ... SI NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA MEXICALI

5 rows × 35 columns

Exploración de los datos

Los datos contienen a todos los sujetos que se han analizado hasta el momento (confirmados, negativos y pendientes).

El siguiente resultado contiene el número de sujetos(renglones) y el número de variables (columnas) presente:

(1259141, 35)

La tabla contiene las siguientes columnas las cuales pueden revisar para generar nuevas preguntas dependiendo de su interés.

Index(['FECHA_ACTUALIZACION', 'ID_REGISTRO', 'ORIGEN', 'SECTOR', 'ENTIDAD_UM',
       'SEXO', 'ENTIDAD_NAC', 'ENTIDAD_RES', 'TIPO_PACIENTE', 'FECHA_INGRESO',
       'FECHA_SINTOMAS', 'FECHA_DEF', 'INTUBADO', 'NEUMONIA', 'EDAD',
       'NACIONALIDAD', 'EMBARAZO', 'HABLA_LENGUA_INDIG', 'DIABETES', 'EPOC',
       'ASMA', 'INMUSUPR', 'HIPERTENSION', 'OTRA_COM', 'CARDIOVASCULAR',
       'OBESIDAD', 'RENAL_CRONICA', 'TABAQUISMO', 'OTRO_CASO', 'RESULTADO',
       'MIGRANTE', 'PAIS_NACIONALIDAD', 'PAIS_ORIGEN', 'UCI', 'MUNICIPIO'],
      dtype='object')

Antes de continuar, debemos aclarar algunas variables presentes en los datos que estan realacionadas con fechas:

  • FECHA_ACTUALIZACIÓN: Corresponde a la fecha de los datos publicados.
  • FECHA_INGRESO: Fecha en la que el paciente ingreso al hospital.
  • FECHA_SINTOMAS: Fecha en la que el paciente empezó con los síntomas.
  • FECHA_DEF: Presenta fecha sí el paciente desafortunadamente falleció.

Datos generales

A partir de la tabla anterior ocupamos la columna RESULTADO para contar a los sujetos con resultado a la prueba de COVID-19 positivos, negativos o pendientes.

Número de personas confirmadas con COVID-19: 560164
Número de personas con resultado negativo a COVID-19: 618779
Número de personas que esperan un resultado de la prueba de COVID-19: 80198
Número de fallecimientos con COVID-19 positivo: 60480
Número de sujetos analizados hasta el momento: 1259141

Algo que notamos en los datos es la presencia de sujetos que tienen una confirmación en la prueba de COVID-19, pero que su fecha de SINTOMAS fue antes de los primeros casos de COVID-19 en México (finales de Febrero).

En una conferencia se aclaró que estas incosistencias se deben a errores al momento de registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
987 2020-08-23 17235f 2 IMSS 19 HOMBRE NUEVO LEON NUEVO LEON AMBULATORIA 2020-01-13 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA SAN NICOLÁS DE LOS GARZA
4383 2020-08-23 044a42 2 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA GUSTAVO A. MADERO
5811 2020-08-23 135d2f 2 SSA 25 HOMBRE CIUDAD DE MEXICO HIDALGO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PACHUCA DE SOTO
37413 2020-08-23 05f3d3 1 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 SI IZTAPALAPA
40519 2020-08-23 189846 2 SSA 15 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-02-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALNEPANTLA DE BAZ
210678 2020-08-23 06e286 2 SSA 5 MUJER COAHUILA DE ZARAGOZA COAHUILA DE ZARAGOZA AMBULATORIA 2020-02-28 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TORREÓN
222573 2020-08-23 194f98 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO MIGUEL HIDALGO
259552 2020-08-23 18ecd7 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO MEXICO HOSPITALIZADO 2020-04-01 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 SI NEZAHUALCÓYOTL
262659 2020-08-23 1732a3 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
268994 2020-08-23 04f68c 2 PRIVADA 15 HOMBRE NO ESPECIFICADO MEXICO HOSPITALIZADO 2020-03-04 ... NO NO NO NO POSITIVO NO ESPECIFICADO Italia 99 NO HUIXQUILUCAN
269004 2020-08-23 0aad01 2 SSA 7 MUJER CIUDAD DE MEXICO CHIAPAS AMBULATORIA 2020-02-29 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TUXTLA GUTIÉRREZ
272437 2020-08-23 0f634f 1 IMSS 25 MUJER SINALOA SINALOA AMBULATORIA 2020-01-29 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
624553 2020-08-23 178775 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-04-02 ... NO NO NO SI PENDIENTE NO ESPECIFICADO México 99 NO APLICA IZÚCAR DE MATAMOROS
625532 2020-08-23 003ca9 2 IMSS 22 HOMBRE QUERETARO QUERETARO AMBULATORIA 2020-02-07 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA QUERÉTARO
628426 2020-08-23 063f1e 2 IMSS 20 HOMBRE OAXACA OAXACA AMBULATORIA 2020-01-30 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA NAZARENO ETLA
630783 2020-08-23 06cf4c 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-03-30 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA PUEBLA
634578 2020-08-23 114288 2 IMSS 19 MUJER NUEVO LEON NUEVO LEON HOSPITALIZADO 2020-05-15 ... SI SI SI NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO LINARES

17 rows × 35 columns

Como primera visualización podemos ver una gráfica de barras los valores NEGATIVOS, POSITIVOS y PENDIENTES por día.

Confirmados con COVID-19

La columna ENTIDAD_RES contiene la entidad en donde se encontraba el sujeto al momento de registrar sus datos.

Podemos agrupar los datos y presentarlos en una tabla con un gradiente para mostrar los Estados con mayor número de casos de COVID-19.

ENTIDAD TOTAL
0 CIUDAD DE MEXICO 92096
1 MEXICO 64595
2 GUANAJUATO 28620
3 TABASCO 27055
4 VERACRUZ DE IGNACIO DE LA LLAVE 26971
5 NUEVO LEON 26487
6 PUEBLA 25586
7 TAMAULIPAS 22806
8 SONORA 20705
9 COAHUILA DE ZARAGOZA 19874
10 JALISCO 18355
11 SAN LUIS POTOSI 16065
12 BAJA CALIFORNIA 15997
13 SINALOA 15359
14 GUERRERO 14116
15 MICHOACAN DE OCAMPO 13692
16 YUCATAN 13596
17 OAXACA 12994
18 QUINTANA ROO 9806
19 HIDALGO 9454
20 CHIHUAHUA 7269
21 BAJA CALIFORNIA SUR 6931
22 CHIAPAS 6169
23 TLAXCALA 5981
24 DURANGO 5867
25 QUERETARO 5591
26 CAMPECHE 5351
27 AGUASCALIENTES 5179
28 MORELOS 4972
29 NAYARIT 4680
30 ZACATECAS 4680
31 COLIMA 3265

O representarlo en una gráfica de barras.

También podemos agrupar los casos confirmados por día y su acumulado.

FECHA TOTAL TOTAL_ACCU
0 2020-01-13 00:00:00 1 1
1 2020-01-29 00:00:00 1 2
2 2020-02-06 00:00:00 1 3
3 2020-02-19 00:00:00 1 4
4 2020-02-21 00:00:00 1 5
5 2020-02-22 00:00:00 2 7
6 2020-02-23 00:00:00 1 8
7 2020-02-25 00:00:00 1 9
8 2020-02-26 00:00:00 1 10
9 2020-02-27 00:00:00 2 12
10 2020-02-28 00:00:00 2 14
11 2020-02-29 00:00:00 2 16
12 2020-03-01 00:00:00 6 22
13 2020-03-02 00:00:00 8 30
14 2020-03-03 00:00:00 6 36
15 2020-03-04 00:00:00 7 43
16 2020-03-05 00:00:00 7 50
17 2020-03-06 00:00:00 10 60
18 2020-03-07 00:00:00 21 81
19 2020-03-08 00:00:00 21 102
20 2020-03-09 00:00:00 64 166
21 2020-03-10 00:00:00 50 216
22 2020-03-11 00:00:00 51 267
23 2020-03-12 00:00:00 60 327
24 2020-03-13 00:00:00 88 415
25 2020-03-14 00:00:00 91 506
26 2020-03-15 00:00:00 100 606
27 2020-03-16 00:00:00 133 739
28 2020-03-17 00:00:00 111 850
29 2020-03-18 00:00:00 123 973
30 2020-03-19 00:00:00 113 1086
31 2020-03-20 00:00:00 183 1269
32 2020-03-21 00:00:00 131 1400
33 2020-03-22 00:00:00 141 1541
34 2020-03-23 00:00:00 222 1763
35 2020-03-24 00:00:00 182 1945
36 2020-03-25 00:00:00 211 2156
37 2020-03-26 00:00:00 248 2404
38 2020-03-27 00:00:00 289 2693
39 2020-03-28 00:00:00 276 2969
40 2020-03-29 00:00:00 266 3235
41 2020-03-30 00:00:00 387 3622
42 2020-03-31 00:00:00 310 3932
43 2020-04-01 00:00:00 466 4398
44 2020-04-02 00:00:00 440 4838
45 2020-04-03 00:00:00 445 5283
46 2020-04-04 00:00:00 454 5737
47 2020-04-05 00:00:00 434 6171
48 2020-04-06 00:00:00 587 6758
49 2020-04-07 00:00:00 516 7274
50 2020-04-08 00:00:00 630 7904
51 2020-04-09 00:00:00 634 8538
52 2020-04-10 00:00:00 969 9507
53 2020-04-11 00:00:00 732 10239
54 2020-04-12 00:00:00 781 11020
55 2020-04-13 00:00:00 974 11994
56 2020-04-14 00:00:00 917 12911
57 2020-04-15 00:00:00 1057 13968
58 2020-04-16 00:00:00 1040 15008
59 2020-04-17 00:00:00 1184 16192
60 2020-04-18 00:00:00 1278 17470
61 2020-04-19 00:00:00 1153 18623
62 2020-04-20 00:00:00 1875 20498
63 2020-04-21 00:00:00 1232 21730
64 2020-04-22 00:00:00 1270 23000
65 2020-04-23 00:00:00 1323 24323
66 2020-04-24 00:00:00 1569 25892
67 2020-04-25 00:00:00 1630 27522
68 2020-04-26 00:00:00 1456 28978
69 2020-04-27 00:00:00 1783 30761
70 2020-04-28 00:00:00 1569 32330
71 2020-04-29 00:00:00 1417 33747
72 2020-04-30 00:00:00 1971 35718
73 2020-05-01 00:00:00 2671 38389
74 2020-05-02 00:00:00 1927 40316
75 2020-05-03 00:00:00 1830 42146
76 2020-05-04 00:00:00 2331 44477
77 2020-05-05 00:00:00 2350 46827
78 2020-05-06 00:00:00 2107 48934
79 2020-05-07 00:00:00 2352 51286
80 2020-05-08 00:00:00 2719 54005
81 2020-05-09 00:00:00 2414 56419
82 2020-05-10 00:00:00 3252 59671
83 2020-05-11 00:00:00 3010 62681
84 2020-05-12 00:00:00 2719 65400
85 2020-05-13 00:00:00 2653 68053
86 2020-05-14 00:00:00 2670 70723
87 2020-05-15 00:00:00 3932 74655
88 2020-05-16 00:00:00 3003 77658
89 2020-05-17 00:00:00 2866 80524
90 2020-05-18 00:00:00 4122 84646
91 2020-05-19 00:00:00 3215 87861
92 2020-05-20 00:00:00 4389 92250
93 2020-05-21 00:00:00 3040 95290
94 2020-05-22 00:00:00 3842 99132
95 2020-05-23 00:00:00 3543 102675
96 2020-05-24 00:00:00 3332 106007
97 2020-05-25 00:00:00 5017 111024
98 2020-05-26 00:00:00 3672 114696
99 2020-05-27 00:00:00 3514 118210
100 2020-05-28 00:00:00 3992 122202
101 2020-05-29 00:00:00 4054 126256
102 2020-05-30 00:00:00 3901 130157
103 2020-05-31 00:00:00 3635 133792
104 2020-06-01 00:00:00 6600 140392
105 2020-06-02 00:00:00 4132 144524
106 2020-06-03 00:00:00 4090 148614
107 2020-06-04 00:00:00 4243 152857
108 2020-06-05 00:00:00 5237 158094
109 2020-06-06 00:00:00 4928 163022
110 2020-06-07 00:00:00 4185 167207
111 2020-06-08 00:00:00 5563 172770
112 2020-06-09 00:00:00 4522 177292
113 2020-06-10 00:00:00 6072 183364
114 2020-06-11 00:00:00 4402 187766
115 2020-06-12 00:00:00 5148 192914
116 2020-06-13 00:00:00 4591 197505
117 2020-06-14 00:00:00 4450 201955
118 2020-06-15 00:00:00 6846 208801
119 2020-06-16 00:00:00 5143 213944
120 2020-06-17 00:00:00 4453 218397
121 2020-06-18 00:00:00 5432 223829
122 2020-06-19 00:00:00 5544 229373
123 2020-06-20 00:00:00 7159 236532
124 2020-06-21 00:00:00 4575 241107
125 2020-06-22 00:00:00 5843 246950
126 2020-06-23 00:00:00 5077 252027
127 2020-06-24 00:00:00 5025 257052
128 2020-06-25 00:00:00 5977 263029
129 2020-06-26 00:00:00 6483 269512
130 2020-06-27 00:00:00 5082 274594
131 2020-06-28 00:00:00 6065 280659
132 2020-06-29 00:00:00 6433 287092
133 2020-06-30 00:00:00 6388 293480
134 2020-07-01 00:00:00 8094 301574
135 2020-07-02 00:00:00 5922 307496
136 2020-07-03 00:00:00 6363 313859
137 2020-07-04 00:00:00 5576 319435
138 2020-07-05 00:00:00 6094 325529
139 2020-07-06 00:00:00 6766 332295
140 2020-07-07 00:00:00 6138 338433
141 2020-07-08 00:00:00 5622 344055
142 2020-07-09 00:00:00 5731 349786
143 2020-07-10 00:00:00 8710 358496
144 2020-07-11 00:00:00 5602 364098
145 2020-07-12 00:00:00 5916 370014
146 2020-07-13 00:00:00 7147 377161
147 2020-07-14 00:00:00 5956 383117
148 2020-07-15 00:00:00 7505 390622
149 2020-07-16 00:00:00 5948 396570
150 2020-07-17 00:00:00 6689 403259
151 2020-07-18 00:00:00 6654 409913
152 2020-07-19 00:00:00 5891 415804
153 2020-07-20 00:00:00 9171 424975
154 2020-07-21 00:00:00 5537 430512
155 2020-07-22 00:00:00 5506 436018
156 2020-07-23 00:00:00 5375 441393
157 2020-07-24 00:00:00 5861 447254
158 2020-07-25 00:00:00 6786 454040
159 2020-07-26 00:00:00 5119 459159
160 2020-07-27 00:00:00 6589 465748
161 2020-07-28 00:00:00 5428 471176
162 2020-07-29 00:00:00 4633 475809
163 2020-07-30 00:00:00 4755 480564
164 2020-07-31 00:00:00 4979 485543
165 2020-08-01 00:00:00 7325 492868
166 2020-08-02 00:00:00 4794 497662
167 2020-08-03 00:00:00 5669 503331
168 2020-08-04 00:00:00 4410 507741
169 2020-08-05 00:00:00 5006 512747
170 2020-08-06 00:00:00 4215 516962
171 2020-08-07 00:00:00 4641 521603
172 2020-08-08 00:00:00 4782 526385
173 2020-08-09 00:00:00 3914 530299
174 2020-08-10 00:00:00 6055 536354
175 2020-08-11 00:00:00 3848 540202
176 2020-08-12 00:00:00 3611 543813
177 2020-08-13 00:00:00 3259 547072
178 2020-08-14 00:00:00 3477 550549
179 2020-08-15 00:00:00 3072 553621
180 2020-08-16 00:00:00 2086 555707
181 2020-08-17 00:00:00 2045 557752
182 2020-08-18 00:00:00 1357 559109
183 2020-08-19 00:00:00 632 559741
184 2020-08-20 00:00:00 324 560065
185 2020-08-21 00:00:00 96 560161
186 2020-08-22 00:00:00 3 560164

No solo podemos revisar los casos confirmados también ver el número de fallecimientos por día y su acumulado.

Antes de las visualizaciones observamos otra inconsistencia en sujetos que tienen registrada una fecha de defunción pero antes de que se registrará la fecha de los sintomas o personas con fecha de fallecimiento antes de los primeros casos de COVID-19 en México.

Comó se menciono anteriormente, esto puede ser por un error al registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO FECHA_SINTOMAS FECHA_DEF INTUBADO NEUMONIA
418331 2020-08-23 14ca54 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-02-11 2020-02-11 2020-03-01 SI SI
623184 2020-08-23 1731ab 1 IMSS 9 MUJER MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-05-24 2020-05-24 2020-04-13 NO SI
1197117 2020-08-23 009132 1 IMSS 27 HOMBRE TABASCO TABASCO HOSPITALIZADO 2020-07-29 2020-07-29 2020-06-29 NO SI
1201831 2020-08-23 1c2b09 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-07-26 2020-07-26 2020-06-27 NO SI

Una manera de visualizar los datos de confirmados y fallecimientos es mediante un gráfico de área ya que en este caso los fallecimientos contados son un grupo de los sujetos confirmados y podemos comparar su proporción.

O gráficar con barras para cada día.

Preguntas que podemos explorar

Utilizando los datos de los casos confirmados, ¿Cuántos ingresaron en hospitales?

Para esto ocupamos la columna TIPO_PACIENTE que contiene valores como Hospitalizado que significa que esta o estuvo presente en un Hospital y Ambulatoria que significa que fue confirmado con COVID-19 pero que no ingreso a un hospital.

Seleccionando a los sujetos confirmados con COVID-19 y que se ingresaron en algún hospital, ¿Cuántos fueron entubados?

Para responder esto ocupamos la columna INTUBADO en la que se señala si el sujeto tuvo que ser intubado como un signo de la complicación de la enfermedad.

TIPO_PACIENTE SEXO CONTEOS
0 AMBULATORIA HOMBRE 206524
1 AMBULATORIA MUJER 209055
2 HOSPITALIZADO HOMBRE 88295
3 HOSPITALIZADO MUJER 56290

Podemos ocupar un gráfico de box plot para saber la distribución de la edad de las personas confirmadas que se encontraron en el hospital.

Podemos crear rangos de edad y observar que grupo es el que ha presentado más casos que requieran hospitalización.

En México siempre se ha mantenido las "noticias" acerca de que los hospitales se encuentran llenos y hemos visto las conferencias acerca de la expansión en hospitales dependendiendo de la situación que se encuentran los Estados. Lamentablemente, con los datos que estamos trabajando en este momento no hay información de esta capacidad en hospitales pero si podemos visualizar el número de personas que se encontraron en los distintos tipos de hospitales.

Commorbilidades

Otro problema que existe en México son las enfermedades que complican la condición del paciente con COVID-19. Entre las más importantes se encuentran Obesidad, Diabetes e Hipertensión. Observando los datos registrados hasta 2016, México presenta un crecimiento en el porcentaje de adultos con obesidad cada año. La siguente gráfica muestra el porcentaje en distintos paises desde 1975 al 2016, incluyendo Mexico.

Ahora en relación con COVID-19, podemos ver el número de personas confirmadas, saber si presentan obesidad y su condición en el hospital.

La misma situación pero con las otras dos cormobilidades, Diabetes e hipertension que estan estrechamente relacionadas con la Obesidad.

Siguiendo el interés de las co-morbilidades podemos clasificar cada paciente con el número de las enfermades que se mencionaron anteriormente ya que son las que presentaron y presentan un mayor riesgo.

Hasta el momento, solo hemos explorado los datos de las personas confirmadas con COVID-19 desde el inicio de la pandemia en México, no las personas que actualmente presentan la enfermedad.

Usando el número de personas confirmadas con COVID19 y con la población total de cada Estado (datos de 2017) podemos determinar el número total de fallecimientos en cada Estado por cada 100 000 habitantes.

O la otra manera que podemos ver los lamentables fallecimientos es por el total de confirmados de COVID-19 en cada Estado. No es la forma más adecuada de ver estos datos, ya que como han explicado, depende mucho del número de pruebas que se hacen. Por lo que muchas pruebas solo reduciría la proporción de fallecimientos por total de confirmados. Pero puede ser útil para ver algúna localidad en la que la proporcion de falleciemientos aumente y tratar de determinar las posibles causas.

Otra manera de ver la relación entre el número de fallecimientos y el número de confirmados mediante un gráfico denominado scatterplot en el que cada punto representa una entidad Federativa.

El siguiente gráfico muestra los casos confirmados en cada Estado desde el inicio de la pandemia en México hasta el día de hoy.

Ya que los datos presentan tanto el Estado como el minicipio podemos realizar un gráfico denominado treemap que nos permite observar los casos totales por localidad y el tamaño de los cuadros es por número correspondiente.

En el caso de los Recuperados, según los informes de la Secretaría de Salud, son los casos después de 15 días al inicio de los síntomas.

Si seleccionamos los casos confirmados de las últimas dos semanas tendríamos los casos que se consideran activos ya que se toma en cuenta que la enfermedad tiene una duración promedio de 14 días. Puede ser que esta restricción no contemple todos los activos ya que pueden existir casos en los que la recuperación sea lenta sin embargo, una alta proporcion de los casos activos se encuentran con el criterio tomado.

Podemos ocupar estos casos activos para generar un treemap.

Casos Por día

Una manera de poder ver el número de casos nuevos por dia es usando un heatmap en que podemos ver el crecimiento de casos por cada 100K personas del Estado. Para poder apreciar mejor el número de casos se calcula el logaritmo base 10. La idea original de esta visualización la puedes encontrar en el siguente artículo:

https://towardsdatascience.com/visualization-of-covid-19-new-cases-over-time-in-python-8c6ac4620c88

Duración epidémica

También es posible explorar la duración de la epidemia COVID19 en cada uno de los Estados. Esto quiere decir tomar el registro de cuando se dio el primer caso confirmado de COVID19 en cada uno de los Estados y continuar el lapso hasta el último día en el que se registro una confirmació. De esta manera podremos ver si algún Estado ha dejado de tener casos.

Debido a los errores al momento de registrar los datos, como se mencionó anteriormente, se tomarán en cuenta solo los datos a partir de inicios de Marzo 2020 que fue de las fechas oficiales.

Teniendo en cuenta este último gráfico, podemos revisar por día como fueron los distintos casos (no acumulados).

El siguente calendario muestra la intensidad de los casos confirmados en todo México por día. Es necesario considerar que debido a los errores de anotación que se describieron anteriormente el calendario iniciaria en Enero y Febrero cuando no en realidad no fue asi. Sin embargo, no se eliminaron ya que cuentan como casos postivos.

También es posible revisar los casos recuperados y observarlos en un calendario.

Y por último los fallecimientos por día.